Extraction d'Information et modélisation de connaissances à partir de Notes de Communication Orale. (Information Extraction and knowledge modelling from oral communication notes)

نویسنده

  • Fabrice Even
چکیده

In spite of the rise of Information Extraction and the development of many applications in the last twenty years, this task encounters problems when it is carried out on atypical texts such as oral communication notes. Oral communication notes are texts which are the result of an oral communication (meeting, talk, etc.) and they aim to synthesize the informative contents of the communication. These constraints of drafting (speed and limited amount of writing) lead to linguistic characteristics which the traditional methods of Natural Language Processing and Information Extraction are badly adapted to. Although they are rich in information, they are not exploited by systems which extract information from texts. In this thesis, we propose an extraction method adapted to oral communication notes. This method, called MEGET, is based on an ontology which depends on the information to be extracted (“extraction ontology”). This ontology is obtained by the unification of an “ontology of needs”, which describe the information to be found, with an “ontology of terms” which conceptualize the terms of the corpus which are related to the required information. The ontology of terms is elaborated from terminology extracted from texts and enriched by terms found in specialized documents. The extraction ontology is formalized by a set of rules which are provided as a knowledge base for the extraction system SYGET. This system (1) carries out a labelling of each instance of every element of the extraction ontology and (2) extracts the information. This approach is validated in several corpora.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Mélusine. Un environnement de modélisation et de coordination de services

RÉSUMÉ. La construction de logiciels à partir de plusieurs applications différentes et hétérogènes est de plus en plus fréquente. Cependant, il n’existe pas à présent une méthodologie de construction pour de tels logiciels. Dans cet article, nous proposons une architecture qui permet de créer des logiciels en faisant collaborer plusieurs services et applications différentes et hétérogènes, util...

متن کامل

Gestion de l'incertitude dans le cadre d'une extraction des connaissances à partir de texte

Résumé. Le domaine de l’extraction de connaissances à partir de texte nécessite des méthodes permettant de détecter et de manipuler l’incertitude. En effet, de nombreux textes contiennent des informations dont la véracité peut être remise en cause. Il convient alors de gérer de manière efficace ces informations afin de représenter les connaissances de manière explicite. Une première démarche co...

متن کامل

Modélisation de connaissances pour un système de médiation

Résumé. Travaillant sur l'élaboration d'une méthodologie de développement de systèmes de médiation intégrés dans des systèmes coopératifs, nous avons proposé une architecture à 3 composants : le premier concerne la coopération, le second l'assistance et le troisième est relatif aux connaissances nécessaires aux 2 précédents. Dans cet article nous présentons plus particulièrement le point de vue...

متن کامل

Traitement et exploration du fichier Log du Serveur Web pour l'extraction des connaissances : Web Usage Mining

Résumé : Le but dans ce travail consiste à concevoir et réaliser un Outil, en se basant sur l’ECD (Extraction de la Connaissance a partir de bases de données), en utilisant les concepts du Web Usage Mining, pour offrir aux web masters l’ensemble des connaissances, y inclut les statistiques sur leurs sites, afin de prendre les bonnes décisions. Il s’agit en faite, d’extraire de l’information à p...

متن کامل

Tâche, domaine et application : influences sur le processus de modélisation de connaissances

Résumé Un nombre croissant d’outils de gestion de documents et de connaissances a désormais recours à des ressources terminologiques et/ou ontologiques (RTO) pour répondre à leurs besoins applicatifs. Nous montrons que le processus de modélisation de telles ressources passe par la prise en compte de la nature du domaine, de la tâche et de l’application visés. Pour cela, nous nous appuyons sur u...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005